FILTER MODE ACTIVE

#цепочка мыслей

Найдено записей: 2

#цепочка мыслей15.06.2025

OThink-R1: Интеллектуальная двухрежимная система рассуждений для сокращения избыточных вычислений в больших языковых моделях

OThink-R1 предлагает инновационный подход для больших языковых моделей, позволяющий переключаться между быстрым и медленным рассуждением, сокращая избыточные вычисления на 23% без потери точности.

#цепочка мыслей19.05.2025

Преодоление разрыва между знанием и действием: как Google DeepMind улучшает принятие решений в LLM с помощью дообучения с подкреплением

Исследователи Google DeepMind разработали метод дообучения с подкреплением, который значительно повышает способность больших языковых моделей действовать в соответствии со своим рассуждением, сокращая разрыв между знанием и действием.